In this paper, we present a modified Xception architecture, the NEXcepTion network. Our network has significantly better performance than the original Xception, achieving top-1 accuracy of 81.5% on the ImageNet validation dataset (an improvement of 2.5%) as well as a 28% higher throughput. Another variant of our model, NEXcepTion-TP, reaches 81.8% top-1 accuracy, similar to ConvNeXt (82.1%), while having a 27% higher throughput. Our model is the result of applying improved training procedures and new design decisions combined with an application of Neural Architecture Search (NAS) on a smaller dataset. These findings call for revisiting older architectures and reassessing their potential when combined with the latest enhancements.
translated by 谷歌翻译
Large language models (LLMs) have been shown to be able to perform new tasks based on a few demonstrations or natural language instructions. While these capabilities have led to widespread adoption, most LLMs are developed by resource-rich organizations and are frequently kept from the public. As a step towards democratizing this powerful technology, we present BLOOM, a 176B-parameter open-access language model designed and built thanks to a collaboration of hundreds of researchers. BLOOM is a decoder-only Transformer language model that was trained on the ROOTS corpus, a dataset comprising hundreds of sources in 46 natural and 13 programming languages (59 in total). We find that BLOOM achieves competitive performance on a wide variety of benchmarks, with stronger results after undergoing multitask prompted finetuning. To facilitate future research and applications using LLMs, we publicly release our models and code under the Responsible AI License.
translated by 谷歌翻译
评估患者结直肠癌的微卫星稳定性状态对于个性化治疗方案至关重要。最近,提出了卷积 - 神经网络(CNN)与转移学习方法结合使用,以规避传统的实验室测试,以确定苏木精和曙红染色的活检全幻灯片图像(WSI)的微卫星状态。但是,WSI的高分辨率实际上阻止了整个WSI的直接分类。当前方法通过先对WSI提取的小斑块进行分类,然后汇总补丁级分类徽标来推断患者级状态,从而绕过WSI高分辨率。这种方法限制了捕获位于高分辨率WSI数据的重要信息的能力。我们引入了一种有效的方法,通过对贴片嵌入的动量学习以及在这些嵌入组的组上培训患者级分类器,以利用WSI高分辨率信息。与直接的补丁级分类和患者水平聚合方法相比,我们的方法的准确性高达7.4 \%(AUC,$ 0.91 \ pm 0.01 $ vs. $ 0.85 \ $ 0.85 \ pm 0.04 $,p Value $ <0.01 $ )。我们的代码可以在https://github.com/technioncomputationalmrilab/coleroctal_cancer_ai上找到。
translated by 谷歌翻译
对绝对姿势回归剂(APR)网络进行训练,以估计给定捕获图像的相机姿势。他们计算了摄像机位置和方向回归的潜在图像表示。与提供最新精度的基于结构的本地化方案相比,APRS在本地化精度,运行时和内存之间提供了不同的权衡。在这项工作中,我们介绍了相机姿势自动编码器(PAE),多层感知器通过教师学生的方法进行培训,以用APR作为老师来编码相机姿势。我们表明,由此产生的潜在姿势表示可以密切复制APR性能,并证明其对相关任务的有效性。具体而言,我们提出了一个轻巧的测试时间优化,其中最接近火车的姿势编码并用于完善摄像头位置估计。该过程在剑桥大标记和7Scenes基准上都达到了APRS的新最新位置精度。我们还表明,可以从学到的姿势编码中重建火车图像,为以低内存成本以较低的存储器成本整合火车的视觉信息铺平了道路。我们的代码和预培训模型可在https://github.com/yolish/camera-pose-auto-coders上找到。
translated by 谷歌翻译
在许多预测性决策方案(例如信用评分和学术测试)中,决策者必须构建一个模型,该模型通过更改其功能来说明代理商“游戏”决策规则的倾向,从而获得更好的决策。尽管战略分类文献以前已经假设代理人的结果并不受其特征的因果影响(因此战略代理人的目标是欺骗决策者),但我们加入了并发的工作,以建模代理人的成果作为其可变化的函数属性。作为我们的主要贡献,我们为学习决策规则提供有效的算法,以在可实现的线性环境中优化三个不同的决策制定目标:准确预测代理的胶结后结果(预测风险最小化),激励代理人改善这些结果(代理结果(代理结果)最大化),并估计真实基础模型的系数(参数估计)。我们的算法避免了Miller等人的硬度结果。 (2020)允许决策者测试一系列决策规则并观察代理人的反应,实际上是通过决策规则执行因果干预措施的。
translated by 谷歌翻译
不确定性估计是评估计算机视觉中深度学习模型的稳健性的重要步骤,特别是在风险敏感区域时。然而,大多数最先进的深层学习模型未能获得不确定性估计或需要显着的修改(例如,制定适当的贝叶斯治疗)以获得它。最先前的方法无法从架子上取下任意模型,并在不培训或重新设计的情况下产生不确定性估计。为了解决这一差距,我们对培训的不确定性估算进行了系统的探索,以进行密集的回归,一个无法识别的,一个重要的问题,并提供理论建设证明这种估计。我们提出了三种简单且可扩展的方法来分析可容忍的扰动中训练网络的输出方差:推断 - 转换,推断噪声和推断出来。它们仅在推理期间运营,无需重新列车,重新设计或微调模型,通常是由最先进的不确定性估算方法所必需的。令人惊讶的是,即使不涉及这种在训练中的这种扰动,与训练所需的最先进方法相比,我们的方法也会产生可比或甚至更好的不确定性估计。
translated by 谷歌翻译